Harness Engineering
(。・ω・。)ノ
驾 驭 工 程 ✧
围绕 AI 智能体设计和构建
约束机制
、
反馈回路
、
工作流控制
和
持续改进循环
的
系统工程实践
(`・ω・´)
Harness
Engineering
约束机制
反馈回路
工作流控制
持续改进
四大支柱 · 上
约束机制
(。ŏ_ŏ)
给 AI 划定执行边界
✓
能做什么 — 安全区域
✗
不能做什么 — 禁止区
🔒
限定工具调用范围
规则化执行标准
反馈回路
(`・ω・´)
实时校验,自主纠错
Step 1
执行
⚡
Step 2
校验
🔍
OK?
🤔
✓
发现错误
需要修正 ⚠️
🔄 修正
自动运行测试验证
错误自主回溯修正
四大支柱 · 下
工作流控制
(。・ω・。)ノ
按流程一步步执行
Step
1
📋
Step
2
🔧
Step
3
🧪
✓
❌ 不跳步
❌ 不摆烂
❌ 不提前宣布完成
✕
严格顺序执行
每步验证后继续
持续改进循环
✧(≖ ◡ ≖✿)
犯错沉淀,越用越稳
😵
犯错
🔍
分析
📝
沉淀
⚡
优化
不再犯
✨
📈 越来越好
错误经验持久化存储
每次迭代更智能
论文 · Building Effective AI Coding Agents
Agent 运行架构
三层
(。・ω・。)
1
Scaffolding
脚手架
系统指令编译 · 工具规范定义 · 执行前准备
系统指令
工具定义
环境配置
2
Harness
运行时编排 · 核心
推理循环 · 工具调用 · 上下文管理 · 安全管控 · 持久化
推理循环
安全管控
持久化
3
Context Engineering
上下文工程
Token 资源分配 · 信息保留与舍弃
Token管理
信息筛选
预编译阶段
Agent 启动前的所有准备
运行时核心 ⭐
Agent 执行的"大脑"
智能记忆管理
有限窗口,无限智慧
一个公式总结 (`・ω・´)ゞ
Coding Agent
能稳定干活的智能体
=
AI Model(s)
一个或多个大模型
+
Harness
完善的驾驭系统
一个
能稳定干活
的 AI 代码智能体 ✧*。٩(ˊᗜˋ*)و✧*。
= 大模型 + 完善的 Harness 系统 (。・ω・。)ノ
约束机制
反馈回路
工作流控制
持续改进